Nsight System and Nsight Compute
Nsys用法:
"""
profile
"""
nsys profile –t cuda,osrt,nvtx,cpu –o baseline –w true python ....
nsys profile --stats=true python ...
"""
env
使用root用户可查看CPU信息
"""
nsys status --env
NCU用法:
- NVIDIA性能分析工具nsight-compute入门 - 知乎
- Nsight 计算分析指南内核分析指南 - 吴建明wujianming - 博客园
Achieved Occupancy cuda的那些信息是什么
- Memory Bound、Compute Bound 和 Latency Bound
- Nsight Compute快速上手指南(中文) - 夢番地
- Why Occupancy of GEMM is 12.5% - CUDA / CUDA Programming and Performance - NVIDIA Developer Forums
sudo环境下如何使用conda 内的NCU
sudo $(which ncu)
sudo $(which ncu) --set full -s 2000 -o decode -f python offline_inference.py